免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」 杜克大学团队发现,扩散大语言模型只需关注少量「中奖」token,就能在推理时把速度提升61-97倍,还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息,实现「少算多准」的双赢。 训练 彩票 token dpad 彩票token 2025-09-27 12:39 2